最简单概率论的五个智慧
现在的世界比过去复杂得多,其中有大量不确定性,是否理解概率,直接决定一个人的开化程度。
随机:有些事情是无缘无故地发生的
这个思想对我们的世界观有颠覆的意义。
古人没有这个思想,认为一切事物都是有因果的,甚至可能都是有目的的。人们曾经认为世界像一个钟表一样精确地运行。但真实世界不是钟表,它充满不可控的偶然。
更严格地说,有些事情的发生,跟他之前发生的任何事情,都可以没有因果关系。不论我们做什么都不能让它一定发生,也不能让它一定不发生。
一个人考了好大学,人们会说这是他努力的结果;一个人事业成功,人们会说这是他努力工作的结果。可是如果一个人买彩票中了大奖,这又是为什么呢?
答案是没有任何原因,这完全是一个随机事件。总会有人买彩票中奖,而这一期彩票中奖,跟他是不是好人,他在之前各期买过多少彩票,他是否关注中奖号码的走势,没有任何关系。
若一个人总是买彩票,他中奖的概率会比别人大点吧?的确,他一生之中中一次奖的概率比那些只是偶然买一次彩票的人大。但是当他跟上千万个人一起面对一次开奖的时候,他不具备任何优势。他之前所有的努力,对他在这次开奖中的运气没有任何帮助。一个此前没有买过任何彩票的人,完全有可能,而且有同样大的可能,在某一次开奖中把最高奖金拿走。
中奖,既不是他个人努力的结果,也不是“上天”对他有所“垂青”;不中,也不等于任何人与他做对。这就是“随机”,你没有任何办法左右结果。
但大多数事情并不是完全的随机事件。偶然和必然结合在一起,就没那么容易理解了。人们经常错误的理解偶然,总想用必然去解释偶然。
体育比赛是最典型的例子。球队赢了球,人人有功,记者帮着分析取胜之道;输了球,人人有责,里里外外都要进行反思,甚至反思能上升到国民素质的层次。但比赛其实是充满偶然的事件,你所能做的就是尽可能争取胜利。哪怕准备的再好,总有一些因素是不确定的,也就是我们常说的运气。很少有记者把输球或赢球的原因归结于运气,人们被随机性所迷惑,狂喜狂怒从不淡定,甚至不惜人身攻击。实际上,现代职业化竞技体育中,参赛者之间的实力差距并不是天壤之别,决定比赛结果的偶然性因素非常大。强队也会输给弱队,这是现代体育的重要特征,也是魅力所在。若强队一定胜利,比赛还有什么悬念?所以偶然因素不值得较真,只要输少赢多依然还是强队。
理解随机性,我就知道很多事情发生就发生了,没有太大可供解读的意义。我们不能从这件事获得什么教训,不值得较真,甚至不值得采取行动。比如,再完美的交通工具也不可能百分百安全,我们会因为极小的事故概率不坐飞机吗?我们只需要确定事故概率比其他旅行方式小就可以了。甚至连这都不需要,只需要确定这个小概率事件我们能够容忍就可以了。避免一朝被蛇咬十年怕井绳。
误差
既然绝大多数事情都同时包含偶然因素和必然因素,我们自然就想排除偶然去发现背后的必然。
偶然的失败和成功都不必大惊小怪,我根据必然因素去发现判断,这总可以吧?
可以,但是必须先理解误差。
历史上最早的科学家曾经不承认实验可以有误差,认为所有的测量必须都是精确的,把任何误差归结为错误。后来人们才渐渐意识到偶然因素是永远存在的,即使实验条件再精确也无法完全避免随机干扰的影响,所以做科学实验往往要测量多次,用取平均值之类的统计手段得出结果。
多次测量确实是一个排除偶然因素的好办法。国足输掉比赛以后经常抱怨偶然因素,裁判不公、主力不在、不适应客场气候,草皮太软、草皮太硬,等等。关键是,如果经常输球,我还是可以得出国足是个弱队的结论。
即便科学实验也是如此,科学家哪怕是测量一个定义明确的物理参数,也不能给出最后的“真实答案”,他们总在测量结果上加一个误差范围比如最近发现的希格斯粒子质量为125.3±0.4(stat) ±0.5(sys) GeV意思是质量125.3,但其中有0.4的统计误差,还有0.5的系统误差。真实的质量其实只有一个,但这个数字是多少,我不知道,它可以是这个误差范围内的任何一个数字。事实上,甚至可能是误差范围外的一个数字。这是因为误差范围是一个概率计算的结果,这个范围的意思是说物理学家相信真实值落在这个范围以外的可能性非常非常小。
所以真实值非常不易得。而且,别忘了科学实验是非常理想化的,大多数事情根本没有机会多次测量。若只能测一次,那么对这一次测量的结果该怎么解读?
只能根据以往经验和类似案例,来估计一个大致的范围。
有了误差的概念,就要学会忽略误差范围内的任何波动。
例子:中国的统计数据,2013年全国居民收入的基尼系数为0.473,新闻报道说,该数据较2012年0.474略有回落,回落有多大?0.001,从统计角度来说,其实没有什么意义,可能测量的误差就大大超过0.001.
赌徒谬误
在没有规律的地方发现规律
小数定律
END
往期精彩回顾
数学与工业革命
泰勒级数的物理意义
如何用数学优雅的拯救数学?
让我知道你在看